,,Przewodnik po pakiecie R'' został po raz pierwszy wydany w roku 2008 i był pierwszą polską książką poświęconą w całości nauce programu R.
Wiele komentarzy od czytelników i lata doświadczeń w nauczaniu programowania, modelowania statystycznego i wizualizacji danych z programem R pozwoliło na ulepszenie ,,Przewodnika...''.
Pobierz bezpłatnie pierwsze dwa rozdziały czwartego wydania
,,Przewodnika po pakiecie R'' [150 stron format pdf].
Pobierz treści zadań z trzeciego wydania ,,Przewodnika po pakiecie R''.
Przykłady z rozdziału 1 (Wprowadzenie),
Przykłady z rozdziału 2 (Podstawy pracy z R),
Przykłady z rozdziału 4 (Niezbędnik statystyka),
Przykłady z rozdziału 5 (Graficzna prezentacja danych),
Tłumaczenie kodów z Przewodnika na język Python,
Tłumaczenie kodów z Przewodnika na język Julia.
Czwarte wydanie to kurs od zera do bohatera, rozszerzone, z bardziej rozbudowanym wprowadzeniem do R i większą liczbą przykładów. Pierwszy rozdział pozwala na zaznajomienie się z programem R nowicjuszowi. Kolejne rozdziały przedstawiają najważniejsze zaawansowane możliwości programu R, w tym narzędzia do przetwarzania dużych danych (Big Data), wizualizacji z pakietem graficznym ggplot2 oraz modelowanie regresyjne.
W klasycznej lub internetowej księgarni, np. Oficyna Wydawnicza Politechniki Warszawskiej, Księgarnia Ekonomiczna lub Księgarnia Naukowa.
Program R jest doskonałym narzędziem dla osób osoby pracujących przy statystycznej analizie danych, maszynowym przetwarzaniu danych czy wizualizacji danych.
R to całkowicie darmowe środowisko do analiz statystycznych z ponad trzema tysiącami dodatkowych pakietów. Wyposażone w elastyczny język programowania jest coraz chętniej wykorzystywane przez wykładowców do nauki analizy danych, przez naukowców do analiz danych oraz przez analityków w bankach, firmach i innych miejscach gdzie występują dane oraz potrzeba ich analizy.
Przewodnik po pakiecie R pozwala poznać język programowania, środowisko pracy i zbiór najprzydatniejszych narzędzie do analizy i wizualizacji danych.
W wydaniu czwartym znaleźć można między innymi:
opis pakietów shiny i knitr, lattice i ggplot2,
jak efektywnie generować zmienne losowe z użyciem kopuli,
jak profilować kod w celu poprawy wydajności,
jak tworzyć własne pakiety,
jak proste wykonać statystyki opisowe i graficzne podsumowania danych.
W roku 2013 ukazało się drugie wydanie książki Analiza danych z programem R, Modele liniowe z efektami stałymi, losowymi i mieszanymi.
W tej pozycji na licznych przykładach danych rzeczywistych omawiane są różnorodne zagadnienia związane z modelowaniem statystycznym. Rozpoczynamy od regresji prostej przez analizę wariancji jedno, dwukierunkową z efektami przeciętymi i zagnieżdżonymi. Następnie przedstawiamy takie zagadnienia jak kolejność testowania, wybór zmiennych, ocena jakości modelu, modelowanie z użyciem efektów stałych i losowych. Książka podzielona jest na cztery główne części, dwie poświęcone teorii i dwie poświęcone przykładowym zastosowaniom.
Spis treści jest dostępny [tutaj].
Książka dostępna jest w postaci elektronicznej w wypożyczalni książek iBUK [link].
Aktualna wersja erraty (do wydania drugiego) jest dostępna [tutaj].
W roku 2014 ukazała się moja nowa książka Odkrywać! Ujawniać! Objaśniać!
Zbiór esejów o sztuce prezentowania danych.
Książka jest dostępna na licencji CC BY&SA na stronie http://biecek.pl/Eseje, można kupić jej papierowe wydanie w księgarniach lub można je wypożyczyć w księgarni ibuk.
Zbiór esejów o sztuce pokazywania danych to próba usystematyzowania wiedzy przydatnej do projektowania i wykonania dobrej wizualizacji danych.
Nie jest to proste. Z jednej strony możemy wpaść w pułapkę pstrokatej papki najeżonej liczbami, którą czasem dumnie nazywa się infografiką. Z drugiej strony wpaść można w pułapkę grafiki idealnie odwzorowującej złożoność liczb a przez to zupełnie niezrozumiałej.
Gdzieś po środku jest grafika, która wyjaśnia, która informuje, która jest estetyczna i treściwa. W kolejnych esejach znajdują się przykłady takich grafik, wraz z licznymi wskazówkami jak takie grafiki tworzyć.
W roku 2015 opracowałem materiały do dwóch kursów analizy danych o nazwie ,,Pogromcy danych'' przygotowanych w formule MOOC. Pierwszy kurs jest wprowadzeniem do programu R, przez wczytywanie danych, omówienie składni, podstawowych typów danych, statystyk opisowych oraz przetwarzania potokowego. Drugi kurs poświęcony jest wizualizacji danych oraz modelowaniu statystycznemu. W pierwszej edycji kursu wzięło udział ponad 2000 osób.
Materiały z pierwszego kursu ,,Przetwarzanie danych w programie R'' są dostępne w formacie ebook jako plik epub lub mobi.
Materiały z drugiego kursu ,,Wizualizacja i modelowanie'' są dostępne w formacie ebook jako plik epub lub mobi.